文本引导的图像操纵任务最近在视觉和语言社区中获得了关注。虽然大多数事先研究专注于单拐操纵,但我们本文的目标是解决更具挑战性的多转映像操纵(MTIM)任务。考虑到一系列指令和先前生成的图像,此任务的先前模型成功生成了图像。然而,这种方法遭受了发布的遭受,并且缺乏指令中描述的物体的产生质量,从而降低了整体性能。为了克服这些问题,我们提出了一种称为视觉引导语言的新建筑,GaN(Lattegan)。在这里,我们通过引入视觉引导的语言注意(拿铁)模块来解决先前方法的局限性,该语言模块提取生成器的细粒度文本表示,以及识别全局和全局的文本条件的U-Net鉴别器架构。假冒或真实图像的本地代表。在两个不同的MTIM数据集,CodraW和I-CLEVR上进行广泛的实验,证明了所提出的模型的最先进的性能。
translated by 谷歌翻译
在本文中,我们介绍了D3RLPY,一个用于Python的开放式离线深度加强学习(RL)库。D3RLPY通过用户友好的API支持多个离线深度RL算法以及在线算法。为协助深入的RL研发项目,D3RLPY提供实际和独特的功能,如数据收集,导出部署,预处理和后处理,分配Q函数,多步学习和方便的命令行界面。此外,D3RLP还提供了一种新颖的图形界面,使用户能够在没有编码程序的情况下训练离线RL算法。最后,实现的算法与D4RL数据集进行了基准测试,以确保实现质量。可以在github上找到d3rlpy源代码:\ url {https://github.com/takuseno/d3rlpy}。
translated by 谷歌翻译
We consider the estimation of average treatment effects in observational studies without the standard assumption of unconfoundedness. We propose a new framework of robust causal inference under the general observational study setting with the possible existence of unobserved confounders. Our approach is based on the method of distributionally robust optimization and proceeds in two steps. We first specify the maximal degree to which the distribution of unobserved potential outcomes may deviate from that of obsered outcomes. We then derive sharp bounds on the average treatment effects under this assumption. Our framework encompasses the popular marginal sensitivity model as a special case and can be extended to the difference-in-difference and regression discontinuity designs as well as instrumental variables. Through simulation and empirical studies, we demonstrate the applicability of the proposed methodology to real-world settings.
translated by 谷歌翻译
我们提供了最大的公开词典,其中包括贝叶斯改进的姓氏地理编码(BISG),以归纳种族和种族的目的。词典基于六个南部州的选民档案,这些档案是在选民注册后收集自我报告的种族数据的。我们的数据涵盖了比任何可比数据集更大的名称范围,其中包含大约100万个名字,110万个中间名和140万个姓氏。个人被归类为五个相互排斥的种族和种族 - 白人,黑人,西班牙裔,亚洲和其他种族 - 每个词典中的每个名称都为种族/种族计数提供了名称。然后可以按列表或列的标准化计数,以获取给定名称或名称的种族的条件概率。然后可以将这些条件概率部署在数据分析任务中,以实现真相和种族数据的基础分析任务。
translated by 谷歌翻译
在本文中,我们考虑在对每个群集建模时,即基于模型的时间序列群集时,将一组单个时间序列集群的任务。该任务需要一个具有足够灵活性的参数模型来描述各个时间序列中的动力学。为了解决这个问题,我们提出了一种基于模型的时间序列聚类方法,该方法具有线性高斯状态空间模型的混合物,具有很高的灵活性。提出的方法对混合模型使用一种新的期望最大化算法来估计模型参数,并使用贝叶斯信息标准确定簇数。模拟数据集上的实验证明了该方法在聚类,参数估计和模型选择中的有效性。该方法应用于真实的数据集,该数据集以前提出的时间序列聚类方法表现出低精度。结果表明,与使用先前方法获得的方法相比,我们的方法产生的聚类结果更准确。
translated by 谷歌翻译
即使在医学和公共政策等高风险设置中,数据驱动的决策也起着重要作用。从观察到的数据中学习最佳策略需要仔细制定效用函数,该功能的期望值在人群中最大化。尽管研究人员通常使用仅依赖于观察到的结果的实用程序,但在许多情况下,决策者的效用函数的特征是所有动作下的潜在结果集合。例如,``不伤害''的希波克拉底原则意味着,在未经治疗的情况下生存的患者导致死亡的成本大于预防救生治疗的成本。我们考虑使用此形式的不对称效用功能的最佳政策学习。我们表明,不对称公用事业会导致无法识别的社会福利功能,因此我们首先部分识别它。利用统计决策理论,我们通过最大程度地减少相对于替代政策的最大遗憾来得出最小的决策规则。我们表明,可以通过解决中间分类问题从观察到的数据中学习最小值决策规则。我们还确定,此过程的有限样本遗憾是由这些中间分类器的错误分类率界定的。我们将此概念框架和方法应用于有关是否使用肺高血压患者是否使用正确的心脏导管插入术的决定。
translated by 谷歌翻译
个人种族和种族的预测在种族差异研究中起着重要作用。贝叶斯改进的姓氏地理编码(BISG)依赖于详细的人口普查信息,已成为该预测任务的主要方法。不幸的是,BISG遭受了两个数据问题。首先,人口普查通常在这些组成员居住的位置的少数群体中含量为零。其次,人口普查数据中缺少许多姓氏 - 尤其是少数民族的姓氏。我们引入了完全贝叶斯改进的姓氏地理编码(FBISG)方法,该方法可以通过扩展BISG方法的天真贝叶斯推断来解决人口普查测量误差。我们还使用了从六个有自我报告的种族的南部州的选民文件中获取的最后,第一个和中间名的其他数据。我们的经验验证表明,FBISG方法论和名称补充剂可显着提高种族归纳的准确性,尤其是对于少数民族而言。
translated by 谷歌翻译
联合分析是一种流行的实验设计,用于测量多维偏好。研究人员研究了在控制其他相关因素的同时如何影响决策。当前,存在两种方法学方法来分析联合实验的数据。第一个重点是估计每个因素的平均边际效应,同时平均其他因素。尽管这允许基于直接设计的估计,但结果严重取决于其他因素的分布以及相互作用效应的汇总方式。一种基于模型的替代方法可以计算各种兴趣,但要求研究人员正确指定模型,这是与许多因素和可能的相互作用的联合分析的挑战性任务。此外,在合并相互作用时,常用的逻辑回归即使具有适度的因素,统计特性也很差。我们提出了一种基于条件随机测试的新假设检验方法,以回答联合分析的最基本问题:考虑到其他因素,感兴趣的因素是否重要?我们的方法仅基于因素的随机化,因此没有假设。但是,它允许研究人员使用任何测试统计量,包括基于复杂的机器学习算法的统计量。结果,我们能够结合现有的基于设计和基于模型的方法的优势。我们通过对移民偏好和政治候选评估的联合分析来说明拟议的方法。我们还扩展了提出的方法来测试联合分析中常用的规律性假设。可以使用开源软件包来实施建议的方法。
translated by 谷歌翻译
在复杂环境中开发针对四足动物的强大视觉引导控制器,具有各种障碍,动力环境和不平坦的地形,这是非常具有挑战性的。尽管增强学习(RL)为敏捷的运动技能提供了有希望的范式,并在模拟中提供了视觉投入,但在现实世界中将RL政策部署仍然非常具有挑战性。我们的关键见解是,除了域间隙的差异,模拟和现实世界之间的视觉外观外,控制管道的延迟也是困难的主要原因。在本文中,我们建议在训练RL代理时解决此问题。具体而言,我们通过使用过去的观测值模拟真实硬件的延迟,并以随机时期进行采样,以进行本体感受和视觉。我们在没有任何预定义的控制器或参考运动的情况下训练RL策略在物理模拟器中以端到端的控制,并将其直接部署在野外运行的真实A1四倍的机器人上。我们在具有复杂地形和障碍的不同室外环境中评估我们的方法。我们证明机器人可以高速操纵,避免障碍物,并在基准方面显示出显着改善。我们的带有视频的项目页面位于https://mehooz.github.io/mmdr-wild/。
translated by 谷歌翻译
在当今的社会中,算法建议和决策已经变得普遍存在。其中许多和其他数据驱动的政策,特别是在公共政策领域,基于已知的确定性规则,以确保其透明度和可解释性。例如,算法预审风险评估,即作为我们的激励申请,提供相对简单,确定性的分类分数和建议,以帮助法官发出释放决策。我们如何根据现有的确定性政策使用数据,并学习新的和更好的策略?不幸的是,策略学习的先前方法不适用,因为它们需要现有的政策是随机而非确定性的。我们开发了一种强大的优化方法,部分地识别策略的预期效用,然后通过最小化最坏情况后悔找到最佳策略。由此产生的政策是保守的,但具有统计安全保障,允许政策制定者限制产生比现有政策更糟糕的结果的可能性。我们将这种方法扩展到人类借助算法建议作出决策的共同和重要的环境。最后,我们将提议的方法应用于预审风险评估工具的独特现场实验。我们推出了新的分类和推荐规则,以保留现有仪器的透明度和可解释性,同时可能以较低的成本导致更好的整体结果。
translated by 谷歌翻译